PRUEBAS Jl-CUADRADO_2 


Prueba de independencia 


Una muestra de n individuos se clasifican de acuerdo a dos características R y C. R está 
dividida en J clases o categorías, (Ri, R2, ..., R3}, y C en K, (Ci, C2, ..., Ck}. Se desea probar 
la hipótesis nula, Ho, que hay independencia entre R y C. Frente a la hipótesis 
alternativa, Hı, que R y C son dependientes o relacionados. 


Para desarrollar la prueba se construye una tabla de doble entrada que contiene las 
frecuencias observadas de cada combinación RixCx. Estas frecuencias observadas las 
denotamos con Oi. 
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Puede demostrarse que si Ho es cierta, es decir si hay independencia entre R y C, las 
frecuencias esperadas de las distintas casillas se pueden estimar multiplicando el total 
de fila por el total de columna y dividiendo por el gran total. Así: 


En=([ Nix mı}/n E 12=( Nix m2) /n Ses eix=[ Nix mk)/n 


€21=( Nx Mı}/N €2=( Nx ma)/n ... Exx=( Nx mx)/n 


Algunos acostumbran escribir las frecuencias esperadas en las esquinas inferiores 
izquierdas o derechas de las respectivas casillas de la tabla. 


El estadístico de contraste utilizado mide el acuerdo entre las frecuencias observadas 
y esperadas y se calcula mediante la fórmula 


dicho estadístico tiene una distribución aproximada como una ji-cuadrado con 
parámetro v =(J-1)(K-1) grados de libertad. 

Se rechaza Ho si yA supera al valor de tablas YE . (Alternativamente se rechaza Ho si 
el p-valor de Pa es menor que el nivel de significación a propuesto). 


Ejercicio 1: Supongamos que en un curso se somete a evaluación una obra literaria. 
Cada alumno opina si la obra es BUENA o MALA. Los resultados obtenidos clasificados 
según el sexo del alumno y la opinión se muestran a continuación: 














opinión Buena Mala total 
Sexo 
mujeres 21 19 
hombres 16 4 
total 




















Puede aceptarse, al 5% de significancia, que la opinión respecto de la obra depende 
del sexo de la persona. 


Solución: 
Ho: La opinión de la persona es independiente del sexo. 
Hı: La opinión de la persona depende del sexo. 
Nivel de sig. a=0.05 


























opinión Buena Mala total 
sexo 
mujeres 40 
hombres 20 
total 20 











(21 — 24.67)? | (19-15.33)2 — (146 — 12.33)? , (4-7.67)? 
g= A A ADT 
c 24.67 15.33 12.33 7.67 


Valor de tablas: a=0.05 y v=(2-1)(2-1)=1 => 7 3.841 


Decisión: 4.273 > 3.841 > rechazo Ho, acepto H: que la opinión está relacionada con el 
sexo o que la opinión depende del sexo de la persona. 


Si queremos comparar cómo opinan las mujeres y los hombres usando los datos 
observados, podemos obtener porcentajes por totales de filas (porque cada sexo 
ocupa una fila): 

















in Buena Mala total 
sexo 
mujeres 21 19 40 
(52.5%) (47.5%) (100%) 
hombres 16 4 20 
(80.0%) (20.0%) (100%) 
37 23 60 
total (61.7%) (38.3%) (100%) 

















Se ve claro que mujeres y hombres opinan diferente. El 80% de hombres dijo que la 
obra es buena, mientras que para las mujeres solo el 52.5% . Es decir que a los hombres 
les gustó más la obra que a las mujeres. 


Dependiendo de lo que deseamos evidenciar de los datos, podemos calcular 
porcentajes de tres maneras distintas: 

. Por totales de fila, como lo hicimos. 

. Por totales de columna (para comparar columnas) 

. Por el gran total. 


Ejercicio 2: un fabricante de jalea enlatada quiere averiguar si la calidad que el 
consumidor encuentra en su producto depende de la cantidad de colorante 
empleado en la fabricación del mismo. Para comprobarlo, reparte 70 latas del 
producto sin colorante, 80 latas con una coloración tenue y 100 latas con coloración 
intensa. La calidad se determina mediante dos opciones: Buena o Mala. Los datos se 
muestran a continuación: 


coloración Sin color Color tenue Color intenso Total 
opinión 














Buena 28 48 52 
Mala 42 32 48 
Total 























. Hacer la prueba al 10% de significancia. 


. Si hubiese relación entre opinión y coloración, determina cuál coloración le conviene 
usar. 


Ejercicio 3:Un investigador que trabaja para una agencia publicitaria, que promovía una 
línea de automóviles costosos, estaba tratando de explicar la propiedad de este tipo de 
automóviles. Tenía información muestral correspondiente a tres variables de propietarios 
de automóviles: Nivel académico ( Con título, Sin título); Ingreso monetario ( Bajo, Alto) y 
Posesión de auto caro ( Sí, No). 


a) Inicialmente el investigador tenía la hipótesis de que había una relación entre el nivel 
académico y la posesión de auto caro. Por lo que hizo un recuentos de sus datos con 
respecto a las dos variables: 





AUT_CARO sl 


A la luz de estos datos, ¿Puede concluirse que hay relación entre el nivel académico y tener 
un auto caro?. Usa un nivel de significancia del 5%. Explica también, usando porcentajes, 
la distribución de tener auto caro o no tenerlo, en cada categoría de nivel académic 


b) Al darse cuenta, el investigador, de que el ingreso puede ser también un factor 
importante, decidió reexaminar la relación entre el nivel académico y la propiedad de 
automóvil caro a la luz del nivel de ingreso. Los datos conjuntos de las tres variables se 
muestran a continuación: 


NIV_ACAD 
Con Título Sin título 
INGRESO INGRESO 
j Alto Bajo Alto 








30 68 i 
45 550 


75 | 350 | 25 | 














Hacer un análisis, por cada nivel de ingreso, si hay relación entre el nivel académico y 
la posesión de auto caro. En cada nivel de ingreso construye la tabla de doble entrada, haz la 
prueba estadística y echa mano de porcentajes para explicar lo pertinente. 


